期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 高斯混合模型与文本图卷积网络结合的虚假评论识别算法
王星, 刘贵娟, 陈志豪
《计算机应用》唯一官方网站    2024, 44 (2): 360-368.   DOI: 10.11772/j.issn.1001-9081.2023020219
摘要151)   HTML7)    PDF (4451KB)(107)    收藏

针对文本图卷积网络(Text GCN)窗口边权阈值策略不足的问题,为了更精准地挖掘相关的词关联结构、提高预测精度, 提出一种高斯混合模型(GMM)与Text GCN结合的虚假评论识别算法F-Text GCN。首先,利用GMM分离噪声边权分布的特性,提高虚假评论在训练数据上相对正常评论数不足的边信号强度;然后,考虑到信源的多样性,综合文档、词汇和评论以及非文本特征构造邻接矩阵;最后,通过Text GCN的谱分解提取邻接矩阵的虚假评论关联结构实施预测。根据国内某大型电商平台采集的126 086条实际中文评论数据开展实证研究,实验结果表明,F-Text GCN识别虚假评论的F1值达到82.92%,与预训练表征模型BERT和文本卷积神经网络相比分别提升了10.46%和11.60%,相较于只使用评论文本信源的Text GCN模型F1值提升了2.94%;研究了高仿虚假评论的预测错误率,在支持向量机(SVM)作用后难识别的评论样本上尝试二次识别,F-Text GCN整体预测准确率可达94.71%,相较于Text GCN和SVM,在识别准确率上分别提升了2.91%和14.54%。研究发现,虚假评论的二阶图邻居结构显示出较强的干预消费者决策的词汇,这表明所提算法特别适用于提取用于虚假评论检测的长程词语搭配结构和全局句子特征模式变化的场景。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 基于二次聚类和隐马尔可夫链的持卡消费行为预测
宋涛, 王星
计算机应用    2016, 36 (7): 1904-1908.   DOI: 10.11772/j.issn.1001-9081.2016.07.1904
摘要353)      PDF (786KB)(307)    收藏
银行卡支付在社会消费行为中占很大比例,在促进经济增长中发挥重大作用,因此,预测持卡消费行为具有重要意义。然而,传统方法难以有效应对复杂数据和动态变化。为此,提出基于二次聚类和隐马尔可夫链(HMC)理论的个体消费行为预测方法。首先,对消费行为按照序列进行模式聚类,并引入惩罚聚类进行二次聚类,对序列模式中的层次状态进行平衡划分;其次,利用HMC来估计序列中消费层次的状态转移,对用户的未来消费行为进行预测。最后,通过实验比较分析传统聚类、无惩罚序列聚类和带惩罚项的聚类结果表明,提出的基于二次聚类和隐马氏链的方法更适用于消费者行为预测。
参考文献 | 相关文章 | 多维度评价
3. 跨项目缺陷预测中训练数据选择方法
王星, 何鹏, 陈丹, 曾诚
计算机应用    2016, 36 (11): 3165-3169.   DOI: 10.11772/j.issn.1001-9081.2016.11.3165
摘要622)      PDF (926KB)(638)    收藏
跨项目缺陷预测(CPDP)利用来自其他项目的缺陷数据预测目标项目的缺陷情况,为解决以往缺陷预测方法面临的训练数据受限问题提供了一个新的视角。训练数据的质量将直接影响跨项目缺陷预测模型的性能,因此,需尽可能选择与目标项目更相似的数据用于模型的训练。利用PROMISE提供的34个公开数据集,从训练数据选择方面,分析了四种典型的相似性度量方法对跨项目预测结果的影响以及各种方法之间的差异。研究结果表明:使用不同的相似性度量方法选出的训练数据质量不同,其中余弦相似性与相关系数两种方法效果更好,且最大改进比例达到6.7%;同时,根据目标项目的缺陷率,发现余弦相似性更适合于缺陷率高于0.25的项目。
参考文献 | 相关文章 | 多维度评价
4. 基于无线传感器网络的智能建筑中目标分布问题研究
王星石 戚亦平 陈曦 宋臣
计算机应用    2010, 30 (1): 253-254.  
摘要1636)      PDF (447KB)(896)    收藏
采用了无线传感器网络技术的楼宇控制系统可以实现目标分布的监测,从而实现照明控制、空调控制、防火监控以及智能保安等应用。实际应用中,无线传感器网络的多径效应对传感器的接收的信号强度指示(RSSI)读数准确性有严重的影响。为解决此问题,引入经验累计分布函数(ECDF)方法,使用条件概率和电子地图两种方法处理无线传感器的数据并给出目标分布结果。经过室内实验数据训练ECDF,测试结果表明,使用此方法判断目标分布鲁棒性强,准确率高。
相关文章 | 多维度评价